智能论文笔记

本文探讨了含义关系的语言和计算方面，这些关系可以在两个或更多复杂的语言表达式（短语，条款，句子，段落）之间保持。特别是，它着重于释义，文本构成，矛盾和语义相似性。在第一部分：“单词和短语级别的相似性”中，我研究了分布假设（DH），并探索了几种不同的方法，以量化单词和简短短语级别的语义相似性。在第二部分：“释义类型和释义识别”中，我着重于释义的含义关系以及自动释义识别（PI）的经验任务。在第三部分中：“释义，文本构成和语义相似性”，我在有关文本意义关系的研究中提出了一个新颖的方向，这是由关于释义，文本构成，矛盾和语义相似性进行的联合研究所产生的。

translated by 谷歌翻译

开发对手挑战NLP系统的方法是提高模型性能和解释性的有前途的途径。在这里，我们描述了团队在第一个动态对抗数据收集（DADC）的任务1中“长角牛”的方法，该研讨会要求团队手动欺骗一个模型，以挖掘出挖掘的问题回答任务。我们的团队首先结束，模型错误率为62％。我们主张采用系统的，语言知情的方法来制定对抗性问题，并描述了试点实验的结果以及我们的官方提交。

translated by 谷歌翻译

NL-Augmenter: A Framework for Task-Sensitive Natural Language Augmentation

Kaustubh D. Dhole , Varun Gangal , Sebastian Gehrmann , Aadesh Gupta , Zhenhao Li , Saad Mahamood , Abinaya Mahendiran , Simon Mille , Ashish Srivastava , Samson Tan

分类：自然语言处理 | 人工智能 | 机器学习

2021-12-06

数据增强是自然语言处理（NLP）模型的鲁棒性评估的重要组成部分，以及增强他们培训的数据的多样性。在本文中，我们呈现NL-Cogmenter，这是一种新的参与式Python的自然语言增强框架，它支持创建两个转换（对数据的修改）和过滤器（根据特定功能的数据拆分）。我们描述了框架和初始的117个变换和23个过滤器，用于各种自然语言任务。我们通过使用其几个转换来分析流行自然语言模型的鲁棒性来证明NL-Upmenter的功效。基础架构，Datacards和稳健性分析结果在NL-Augmenter存储库上公开可用（\ url {https://github.com/gem-benchmark/nl-augmenter}）。

translated by 谷歌翻译